Import

sdasdaksldjklsdjklasjdklj dasmkdlmsakldmklsadmkls

import numpy as np
import pandas as pd

pd.Series.map

map은 Series의 method로 mapping(또는 function)을 통해 Series에 있는 각각의 값을 다른 값으로 바꾼다.
Note : Series에 있는 각각의 값이 elementwise로 함수(mapping)에 입력이 되어 여러번 계산된다고 생각하면 편하다.
Parameters
- arg : function,dict,Series…
- …
Returns
- Series

s = pd.Series(["cat","dog",np.nan,"rabbit"])

s.map({"cat":"kitten","dog":"puppy"})

0    kitten
1     puppy
2       NaN
3       NaN
dtype: object

s2 = pd.Series(["lion","elephant","dog",np.nan])
s.map(s2)

0    NaN
1    NaN
2    NaN
3    NaN
dtype: object

s.map(lambda x : "I am a {}".format(x))

0       I am a cat
1       I am a dog
2       I am a nan
3    I am a rabbit
dtype: object

s = pd.Series([0.1,3,2,0.4])
s.map(lambda x : sum(x))
>>> TypeError: 'float' object is not iterable

각각의 값(여기선 float)이 따로따로 함수(mapping)이 입력된다. 하지만 sum함수는 float형을 input으로 할 수 없으므로 오류 발생함.(float형은 iterable하지 않음)

s = pd.Series([0.3,2,0.4,5])
s.map(np.var)

0    0.0
1    0.0
2    0.0
3    0.0
dtype: float64

apply는 DataFrame의 method로 DataFrame의 축을 따라서 함수를 적용한다.
Note : DataFrame의 apply는 vector(column,row)단위로 함수에 입력된다.(map이나 applymap은 element들이 함수의 입력이 된다.)
Parameters
- func : 각각의 column,row(vector)에 적용되는 함수
- axis : 0이면 row에 1이면 column애 적용
Returns
- Series or DataFrame

n1 = pd.Series([0.1,4,0.35,2])
n2 = pd.Series([0.3,0.4,3,-5])
df = pd.DataFrame({"n1":n1,"n2":n2})
df

df.apply(func = lambda x : sum(x)/len(x),axis=0)

n1    1.6125
n2   -0.3250
dtype: float64

df.apply(np.mean,axis=0)

n1    1.6125
n2   -0.3250
dtype: float64

#vector에 elementwise**2
#np.array를 **2하면 모든 원소가 제곱되는 것과 같다.
df.apply(func = lambda x : x ** 2,axis=0)

#vector에 elementwise로 sin취함.
df.apply(func = lambda x : np.sin(x),axis=0)

df.apply(sum,axis=1)

0    0.40
1    4.40
2    3.35
3   -3.00
dtype: float64

df.apply(np.sin,axis=1)

#vector에 elementwise**2
#np.array를 **2하면 모든 원소가 제곱되는 것과 같다.
df.apply(func = lambda x : x ** 2,axis=1)

applymap은 DataFrame의 method로 mapping(또는 function)을 통해 DataFrame에 있는 각각의 값을 다른 값으로 바꾼다.
Note : DataFrame에 있는 각각의 값이 elementwise로 함수(mapping)에 입력되어 여러번 계산된다고 생각하면 편하다.
Parameters
- func
- …
Returns
- DataFrame

n1 = pd.Series([0.1,4,0.35,2])
n2 = pd.Series([0.3,0.4,3,-5])
df = pd.DataFrame({"n1":n1,"n2":n2})
df

df.applymap(lambda x : "값은 {}".format(x))

df.applymap(lambda x : len(str(x)))

df.applymap(lambda x : x ** 2)

df.applymap(lambda x : sum(x))
>>> TypeError: 'float' object is not iterable

Series의 map method와 마찬가지로 DataFrame의 applymap method도 각각의 값(여기선 float)이 따로따로 함수(mapping)에 입력된다. 그러므로 sum함수에서 오류가 발생한다.

df.applymap(lambda x : np.mean(x))